統計検定2級 練習問題⑦

統計検定2級 対策問題(3月28日分)

本日は「標本分布の計算」「確率の乗法定理」「情報セキュリティ(サニタイジング)」など、実践的な内容を中心に出題します。


問1:母分散 σ² = 100 の母集団から、サンプルサイズ n = 25 の標本を抽出したとき、標本平均の標準誤差(SE)はいくらですか。

  • 2
  • 4
  • 10
  • 20
【解説を表示】

正解:2

標準誤差は √(σ² / n) で求められます。√ (100 / 25) = √4 = 2 となります。分散(4)と標準誤差(2)を混同しないようにしましょう。

問2:事象Aが起こったという条件の下で事象Bが起こる「条件付き確率 P(B|A)」を求める式として正しいものはどれですか。

  • P(A ∩ B) / P(A)
  • P(A ∩ B) / P(B)
  • P(A) × P(B)
  • P(A) + P(B)
【解説を表示】

正解:P(A ∩ B) / P(A)

条件となる事象Aの確率 P(A) を分母に置きます。ベイズの定理の基礎となる非常に重要な公式です。

問3:クロスサイトスクリプティング(XSS)を防ぐために、ユーザーが入力した「<」や「>」などの特殊文字を無害な文字列に変換する処理を何と呼びますか。

  • サニタイジング(エスケープ処理)
  • フィルタリング
  • ハッシング
  • ソルト(Salt)
【解説を表示】

正解:サニタイジング(エスケープ処理)

プログラムとして実行されないように「消毒」するイメージです。WordPressでも、出力前に `esc_html()` などの関数を使ってこの処理を行うのが基本です。

問4:ある標本の偏差平方和(SS)が 100、サンプルサイズ n が 5 のとき、この標本の「不偏分散」の値はいくらですか。

  • 25
  • 20
  • 4
  • 5
【解説を表示】

正解:25

不偏分散は 偏差平方和 / (n – 1) で求めます。100 / (5 – 1) = 100 / 4 = 25 です。5で割ってしまうと「標本分散(20)」になり、母分散を過小評価してしまいます。

問5:3つの群(各群のサンプルサイズは 10)に対して一元配置分散分析を行うとき、「群間」の自由度はいくらですか。

  • 2
  • 3
  • 9
  • 27
【解説を表示】

正解:2

群間の自由度は(水準数 – 1)で求めます。3つの群があるため、3 – 1 = 2 です。ちなみに群内の自由度は(全体数 – 水準数)で、30 – 3 = 27 となります。

問6:相関係数 r = -0.5 であるとき、決定係数 R² はいくらですか。

  • 0.25
  • -0.25
  • 0.5
  • -0.5
【解説を表示】

正解:0.25

決定係数は相関係数の2乗です。(-0.5) × (-0.5) = 0.25 となり、マイナスにはなりません。

問7:正規分布において、平均 μ から左右に 2σ(標準偏差の2倍)の範囲内に、全データの約何%が含まれますか。

  • 約 95%
  • 約 68%
  • 約 99%
  • 約 50%
【解説を表示】

正解:約 95%

正確には ±1.96σ の範囲が 95% です。±1σ は約 68%、±3σ は約 99.7% となります。これらは頻出の数値です。

問8:「実際には母集団の間に差があるのに、有意な差がないと判断してしまう誤り」を何と呼びますか。

  • 第2種の過誤(β)
  • 第1種の過誤(α)
  • 検出力(1-β)
  • 信頼係数
【解説を表示】

正解:第2種の過誤(β)

差を見逃してしまう「ぼんやりものの誤り」です。一方、差がないのに差があると言ってしまうのは「第1種の過誤」です。

問9:箱ひげ図において、箱(ボックス)の長さが表している指標は何ですか。

  • 四分位範囲(IQR)
  • 標準偏差
  • 中央値
  • 範囲(最大値 – 最小値)
【解説を表示】

正解:四分位範囲(IQR)

箱の上下(左右)の端は第1四分位数と第3四分位数を表しており、その差である四分位範囲が箱の長さになります。

問10:重回帰分析において、説明変数同士に強い相関があることで、係数の推定が不安定になる現象を何と呼びますか。

  • 多重共線性(マルチコ)
  • 自己相関
  • 不均一分散
  • 偽相関
【解説を表示】

正解:多重共線性(マルチコ)

似たような情報を表す変数を同時に入れると発生します。これを防ぐには、相関の強すぎる変数を片方除外するなどの対策が必要です。